데 이 터 의 지 역 성 을 이용한 빈 발 구간 
항 목 집합 생 성 방법 
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요 약 


최 근 에 대 용 량 의 데 이 터 베 이 스 로부터 연 관 규 칙 을 발 견 하 고자 하는 연 구 가 활 발 하며, 수 량 항 목 에도 적 용 할 
수 있도록 이들 방 법 을 확 장 하는 연 구 도 소 개 되 고 있다. 본 논 문 에서는 수 량 항 목 을 이진 항 목 으로 변 환 하기 
위하여 빈 발 구간 항 목 집 합 을 생 성 할 때, 수량 항 목 의 정의 영역 내 에 서 특정 영 역 에 집 중 하여 발 생 하는 특 성 인 
지 역 성 을 이용하는 방 법 을 제 안 한 다. 이 방 법 은 기 존 의 방 법 보다 많은 수 의 세밀한 빈 발 구간 항 목 들 을 생 성 할 
수 있을 뿐만 아니라 세 밀 도 를 판 단 하여 활용할 수 있는 생 성 순서 정 보 도 포 함 하고 있어, 원 데 이 터 가 가지고 
있는 특 성 의 손 실 을 최 소 화 할 수 있는 특 징 이 있다. 인 구 센서스 등 실 데 이 터 를 사용한 성 능 평 가 를 통하여 
기 존 의 방 법 보다 우 수 함 을 보였다. 
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1. 서 론 


데이터베이스 기 술 의 발 전 으로 이룰 사 용 하는 업 
무가 급속히 늘 어 나 면서 저 장 되는 데이터 양 또한 
폭 발 적 으로 중 가 하 여 대 용 량 화 되고 있다. 이러한 대 
용 량 화 된 데 이 터 베 이 스 에는 사 용 자 가 미처 파 악 하 
지 못하는 중요한 정보 또는 지 식 이 포 함 되어 있을 
수 있으나, 기 본 적 으로 데 이 터 배 이 스 는 일정한 형태 
의 질 의 에 빠른 응 답 을 위한 시 스 템 이 므로 현 실 세계 


본 연 구 는 정 보 통 신 부 의 180 사 업 에 의해 수 행 된 것임 
” 정회원, 순 천 향 대 학교 대학원 박 사 과정 
정회원, 순 천 향 대 학 교 정 보 기 술 공학부 교수 


(76891 \000) 에 서 나타나는 다양한 규 칙 성 (768443- 
ㅁ [) 올 발 견 하 기 에 는 한 계 가 있다. 이러한 대용량 데 
이 터 베 이 스 에 내 재 된 유용한 지 식 을 탐 사 하는 기술 
을 데 이 터 마 이 닝 (03 0 ㅁ 10108) 이 라 하며, 이에 대한 
연 구 가 최 근 에 활 발 하 게 진 행 되고 있다. 

데 이 터 마 이 닝 은 대 량 의 실제 데이터, 즉 트랜잭션 
(680580007) 을 발 생 시 킨 특 성 올 효과적으로 반 영 하 
여 의 사 결 정 (060510 ㅁ 20310208) 에 유용한 정 보 를 제 
공 한다. 예 를 들어 대형 할 인 매 장 에서 “ 노 트 " 와 “ 연 
필 ” 을 구 매 한 고 객 의 85% 가 “ 지 우 개 ” 를 같이 구 매 한 
다는 연 관 규 칙 을 판매 데 이 터 베 이 스 의 자 료 에 서 찾 
을 수 있다. 이와 같이 데 이 터 마 이 닝 은 상 식 적 인 감 
(868108) 을 사 실 ((300 로 전 환 시킬 수도 있지만, 슈퍼 
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마 켓 에서 “아기 기 저 귀 ” 를 구 매 한 사 람 이 “ 맥 주 ” 도 
함께 구 매 한 다 와 같이 전혀 예 상 하 지 못한 규 칙 도 
탐 사 할 수 있다. 이처럼 데 이 터 마 이 닝 은 대 용 량 의 데 
이 터 베이스 자 체 가 가지고 있는 모든 규 칙 을 탐 사 할 
수 있다. 

데 이 터 마 이 닝 은 크게 예 측 (0600000) 과 지 식 탐사 
- 0000\16086 04600?67) 로 구 분 [1} 한 다 … 예 측은 특 
한 목 표 에 관 심 을 가지고 과 거 의 기 록 을 기 초 로 미래 
의 새로운 사 건 (6886/ 에 적 용 하기 위하여 이 용 하 며 , 
분 류 (013991103000), 시계 열 (4706 56269) 동의 방법 
이 있다. 반 면 에 지 식 탐 사 는 예 측 보 다 적은 정 보 로 도 
가 능 하 며 의 사 결 정 지 원 (0601910 ㅁ 540001 에 적합한 
방 법 이 다. 군 집 화 (0148[60108), 연 관 규 칙 (46500183000 
2468) 동이 해 당 된다. 지 식 탐 사 의 한 분 야 인 연 관 규 
칙 (3980013000 27169) 탐 사 에 관한 문 제 는 4878\3112] 
이 처음 제안한 이후 수많은 연 구 가 있었고, 최 근 에 
도 이 분 야 의 연 구 는 활 발 하게 진 행 되고 있다. 

현 실 세 계 에서 발 생 하는 트 랜 잭 션 ( 또 는 사 건 ) 은 그 
특 성 을 나타내는 항 목 (1[60) 들 의 집 합 으로 항 목 집 합 
(6600660) 의 단 위 로 데 이 터 베 이 스 에 기 록 되어 대용 
량 화 된다. 여 기 에 자주 발 생 하 는 항 목 집 합 들 간의 상 
호 관 련 성 을 발 견 하는 작 업 을 연 관 규 칙 (365600180070 
70416) 이 라 한다. 이 분 야 는 이진 연 관 규 칙 (61087 88- 
60018004 0416), 즉 “한 트랜잭션 내 에 서 특정 항 목 이 
나타나면 반드시 다른 항 목 도 그 트랜잭션 내에 함께 
나타난다.” 라는 형 태 의 규 칙 성 발 견 에 대한 연 구 가 
활 발 하 다 [3-71. 

센서스 데 이 터 와 같이 수량 속 성 이 강한 자 료 와 
경 우 에도 이진 연 관 규 칙 탐 사 가 가 능 하 다. 그러나 연 
령 , 자녀 수 등 센서스 데 이 터 에 포 함 된 많은 수 
속 성 을 무 시 하고 연 관 규 칙 을 탐 사 한다는 것은 발견 
할 수 있는 규 칙 이 극히 제 한 적 이거나 불 가 능 하다. 예 
들 들어 사 람 의 연 령 은 수량 데 이 터 로써 발 생 영 역 은 
1 세 에서 120 세 인데, 이를 하 나 의 항목, 즉 ' 연 령 ' 을 
취하여 연 관 규 칙 을 탐 사 할 경우 발 견 할 수 있는 규칙 
은 극히 제 한 적 이다. 반대로 수 량 항 목 의 정 의 영역 내 
"。 의 각 수 치 를 그대로 항 목 으 로 설 정 하 여 빈 발 항 목 집 
합 을 생 성 한 다면 탐 사 공 간 이 너무 넓고, 발 생 하 는 항 
목이 분 산 되어 있어 탐 사 가 불 가 능 하다. 

이와 같은 문 제 는 수량 항 목 의 정 의 영 역 을 여러 
개의 소 구 간 으 로 분 할 하여 최 소 지 지 도 를 만족할 때 
까지 병 합 하여 빈 발 구간 항 목 집 합 1: 을 생 성 [8.9] 한 다. 


빈 발 구간 항 목 은 최 소 지 지 도 를 만 족 해 야 하는데, 이 
의 판 단 기 준 은 해당 구간 내에 데 이 터 의 발 생 빈 도 
(66046009) 에 따라 결 정 된 다. 일 반 적 으로 실 세 계 데 
이 터 들의 발 생 빈 도 는 특정 영 역 에 치 우 치는 경향, 즉 
지 역 성 (10031[) 를 갖는다. | 

본 논 문 에서는 센서스 데 이 터 와 같이 수 량 적 속성 
데 어 터 의 항 목 을 여러 개의 구 간 으로 분 할 할 때 데이 
터 발 생 의 지 역 성 을 고 려 하여 빈 발 구간 항 목 집 합 을 
생 성 하 는 방 법 을 제 안 한 다. 이 방 법 은 밀도 높은 
간 을 중 심 으로 빈 발 구간 항 목 을 생 성 하 므로 원 래 의 
데 이 터 가 가진 특 성 의 손 실 을 최 소 화 할 수 있는 특 
이 있다. 

본 논 문 의 구 성 은 제 2 장 에서 연 관 규 칙 탐 사 의 기본 
정의, 탐사 알고리즘 그리고 수량 항 목 에 대한 빈발 
구간 항 목 집합 생 성 방 법 에 대하여 알 아 본다. 3 장 에 
서는 빈 발 구간 항 목 집 합 을 생 성 하는 새로운 방 법 을 
제 안 하고, 그 예 를 보인다. 4 장 에서는 성 능 을 평 가 하 
고, 마 지 막 으로 결론 및 향 후 과 제 를 밝힌다. 


2. 연관 규칙 탐사 


2.1 연관 규칙 정의 
2.1.1 빈발 항 목 집 합 (13766 1167056() 의 정의 


빈 발 항 목 집 합 을 정 의 하 기 위하여 항 목 집 합 (1), 트 
랜 잭 션 (1), 데 이 터 베 이 스 (10) 를 다 음 과 같이 정 의 한 다. 


1 = {1 3 5 … . 920, 3 01, ., , 20) 는 항 목 (1600) 


이대 


ㆍ ㅜ :1 의 부 분 집 합 ( ㅠ 드 ]) 이 며 , 항 목 의 중 복 은 불 
허 한다. 

ㆍ 1: ㅁ 개의 트 랜 잭 션 들 집 합 이 며 , 각 트 랜 잭 션 은 
고 유 한 번 호 (110) 를 가진다. 


여기서, 트 랜 잭 션 과 다른 모든 항 목 집 합 들 내에 
있는 항 목 들 은 정 렬 된 것으로 가 정 한 다 . 만 일 트 랜 잭 
션 가 ※ 의 모든 항 목 들을 포 함 한 다 면 (※× 드 1), [가 
집합 ※ 를 지 지 한 다 (64000[ 고 한다. 물론 ※ 는 1 의 
부 분 집 합 이다. ※ 의 지 지 도 를 964020(※) 로 표 기 하며, 
이는 ※ 를 지 지 하 는 에 있는 모든 트 랜 잭 션 들 의 수 


1) 수 량 항 목 의 빈 발 항 목 집 합 (1086 16056[/ 을 이 진 항 목 의 
경 우 와 구 분 하기 위하여 빈 발 구간 항 목 집 합 (102 ㅇ -166@ 
166971560 이 라 정 의 한 다 . 


를 의 미 한다. 

만일 최 소 지 지 도 (5.00) 에 대하여 56400) ㅎ 5 ㅠ ㅠ 
이라면, “접한 주는 빈 발 라나" 라고 하며, 항 목 들 의 
집합 ※ 를 빈 발 항 목 집 합 (128 ㅇ 16015 또는 1100460[ 
16601560 이 라 한다. 최 소 지 지 도 는 주 어 지 며 , 에 대 
하여 관심 있는 항 목 만을 고 려 대 상 으 로 하기 위하여 
사 용 한 다. 또한 ※ 가 개의 항 목 으 로 구 성 되 어 있다 
면 , - 항 목 집 합 (-1(600560 라 한다. 


2.1.2 연관 규 칙 (355003110 ㅁ 1746) 의 정의 
한 트 랜 잭 션 에 서 발생한 항 목 들 의 양은 고 려 하 지 
않으며, 그 항 목 들 의 발생 여 부 만 을 고 려 하 기로 가정 
한다. 연 관 규 칙 (36690013000 1416) 을 다 음 과 같이 
정 의 한 다. 


브아 오 


이 때 ※ 와 는 서로 같은 원 소 룰 갖지 않는 항목 
이다. 즉 ※, ? 드 1 이고, ※() = 0@ 이 다. 

만약 데이터베이스 의 트 랜 잭 션 들 중에서 6 % 가 
※× ㄴ 4 를 포 함 한 다면 연 관 규칙 ㅁ : × -> 는 트 랜 잭 
션 들의 집합 에서 지 지 도 (64000 068766) 5 를 가 
지고 있다. 또 한 만 약 에 있는 트 랜 잭 션 들 중에서 
ㅇ % 가 ※ 를 포 함 하 고 있고, 이들이 또한 ? 를 포 함 하 
고 있다면 연 관 규 치 ㅁ : ※ -> ㅠ 는 집합 에서 신뢰도 
(6008006006 068166) 0 를 가진다. 


2.1.3 연 관 규칙 탐 사 의 기본적인 접 근 방 법 

연 관 규칙 탐사 문 제 와 관련된 알 고 리 즘 은 다 양 하 
게 연 구 되었고, 또한 연 구 되고 있다. 그러나 서로 다 
른 알 고 리 즘 에도 불 구 하 고 이 들 의 기본적인 스키마 
는 유 사 하다. 즉 , 연관 규 칙 을 탐 사 하기 위하여 데이 
터 베 이 스 에 있는 모든 항 목 들의 지 지 도 를 계 산 하여 
빈발 항 목 집 합 (12786 160056[5) 을 찾고, 이 로 부터 주 
어진 신 뢰 도 를 바 탕 으로 실 제 의 규 칙 을 탐 사 하는 과 
정 으로 이루어지는 2 단 계 구 조 이다. 


단계 1 : 빈발 항 목 집 합 들 (14066 16015669) 을 찾는 
단 계 로 주어진 최 소 지 지 도 (5660) 이상의 
트랜잭션 지 지 도 를 가지는 항 목 집 합 들인 
빈 발 항 목 집 합 을 찾는 과정 

[ 단 계 1] 에 서 생 성 된 빈발 항 목 집 합 을 사 
용하여 연 관 규 칙 을 생 성 하는 단계 ' 


단계 2 : 
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연관 규칙 탐 사 의 전 체 성 능 은 첫 번째 단 계 에 서 
결 정 된 다. 데이터베이스 속에 고 려 대 상 빈발 항 목 의 
수 는 모든 항 목 들 의 집 합 (00\6 ㅁ 56[/ 의 크 기 와 같 
다. 즉 항 목 들 의 수 중 가 에 대하여 고려해야 할 항목 
의 크 기 는 기 하 급 수 적 으로 증 가 하 여 상 당 량 의 처리 
시 간 과 메 모 리 를 요 구 한 다. 40 ㅁ 00713], ^0000110 
13.10], ^4000085960500[3], 0 브 비 4], 2820000 피 51], 1216 
111], 10060 58002109151, 5810012708 스 00708 아 [6] 등 
연 관 규칙 탐사 알 고 리 즘 들 대 부 분 이 이러한 문 제 의 
해 결 에 중 점 을 두고 있다. 


2.2 연 관 규 칙 탐사 알고리즘 


연 관 규칙 탐 사 의 대표적인 알 고 리 즘 으로 알려진 
0000 는 해당 항 목 의 발생 유 무 만 고 려 하는 이 진 항 
목 의 탐 사 에 적합한 알 고 리 즘 이다. 그러나 이 알 고 리 
즘 의 탐사 원 리 가 간 편 하 고 이 해 가 용 이 하여 많은 
웅 용 알 고 리 즘 이 있다. 


2.2.1 40002 알고리즘 


그림 1 은 40002 알 고 리 즘 이며, 그림 2 는 알고리즘 
내 에 서 항 목 의 죠 인 (]010) 과 전 자 (6 ㅁ 406) 를 수 행 하 는 
스 0000-0660 함 수 이다. 이 알 고 리 즘 의 첫 번째 단계 
에서는 빈 도 수 를 계 산 하여 빈발 1- 항 목 집 합 을 결정 
하 고 ,((=>2) 번 째 는 두 단 계 로 분 할 하 여 알 고 리 즘 이 
진 행 된 다. 

먼저, (-1) 번 째 검 색 에 서는 발 견 된 빈 발 항 목 집 합 
Ｌ ㄴ 를 후 보 항 목 집합 (, 으 로 만든다. 다 음 으 로 18 를 
검 색 하여 (에 있는 후 보 항 목 집 합 의 지 지 도 를 계산 
한다. 해 시 트 리 (06864 ㅁ ㅎ 6) 를 이 용 하 여 지지도 계산 
의 효 율 성 을 높이고 있 다 [4]. (에 있는 후 보 항 목 집 
합 중에서 최 소 지 지 도 를 만 족 하는 항 목 만 Ｌ 에 진입 
시킨다. 이러한 시 행 은 Ｌ, 가 더 이상 발 견 되지 않을 
때 까지 반 복 한다. 이 알 고 리 즘 의 성 능 은 그림 2 의 죠 
인과 전 지 에 많은 영 향 을 받고 있다. 

그림 3 은 표 1. 예제 데 이 터 베 이 스 를 대 상 으로 410- 
00 알 고 리 즘 으로 빈 발 항 목 집 합 을 탐 사 하는 과 정 이 
다. 표 1 에 는 트랜잭션 4 개 , 항목 5 개 의 예제 데이터 
베 이 스 이며, 최 소 지 지 도 는 50% 로 가 정 한다. 그 러 므 
로 트랜잭션 4 개 중에서 2 개 이 상 에 해당 항 목 이 포함 
되어 있어야 빈 발 하다고 할 수 있다. 
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// 28 검 색 하 여 01, Ｌ] 생성 
1= {18206 1-16008665} 
107 (0<=2 ; 661 추 ㅇㅇ ; 6++) 00 160810 
2, ㅋ 300200-9860(-1) ; // 계 6\ 08001021658 


10721] ㅁ ㅠ 87 ㅁ 820000 Ｌ 드 10 00 10660 
2 = 91410666(606 0 ; 
10601] 0300100[66 0 ㄷ ㅎ ( 00 
@.00140 타 + ; 
600 
0 = { 6 트 0, | 06.000 마 으 500 ) 
600 
스 09\67 = 나 7 ) 


그림 1. ^&40 ㅁ 1011 알고리즘 


1) ]007 단계 
1096 타 1060 0 
86160 2.116201, 2.116002, 2.1661003,'' 2.164600(, 
0.662061 
16700 늬 01 2, 1 0// 561 1027 
\11676 2 ㅁ .1(62001 - 0.1661001, ''' 2.166000-2 = 
0.16600(-2, 2.11600(-1 < 0.166006-1 ) 
2) 20076 단계 


10111 116008606 < 드 (+ 00 
1072011(-1) - 54106666 5 아 ㅇ 00 
타 (6  ' 트 트 -12)016 ㅁ 0 
06166 ㅇ 600 0: 


그림 2. 40 ㅁ 1001-961 함수 


표 1. 예제 데이터베이스 


위 예 를 통하여 알 수 있 듯 이 항 목 의 존재 유무 
발생 빈 도 만으로 빈 발 항 목 집 합 을 생 성 하며, 해당 항 
목 의 수 량 은 고 려 하지 않고 있다. 


2.3 기 존 의 수 량 항목 분 할 방법 


다 음 과 같은 2 개 의 연 관 규 칙 (1, 2) 을 살펴보면, 
은 나름대로 의 미 가 있지만, 82 가 묘 보 다 고급 정 
보이다. 


이 항목 | 지지도 


{2.3.5} 2 


그림 3. ^40「10(| 수 행 과 정 


1 : “ 노 트 와 연 필 을 구 매 한 고 객 들 의 885% 가 
지 우 개 를 동시에 구 매 한 다" 

82 : “노트 2 권 과 연필 3 자 루 를 구 매 한 고객들 
의 85% 가 지우개 1 개 를 동시에 구 매 한다” 


#; 은 항 목 의 발생 여 부 만 으 로 도 연 관 규 칙 의 탐사 
가 가 능 하 지 만, ; 는 불 가 능 하다. 그러므로 항 목 의 
값 을 임 의 의 실 수 (7621) 값 으로 확장 등 의 방 법 이 필 
요 하 게 되어, 최 근 에 항 목 들을 범주 데 이 터 (6366- 
80 ㅁ 081 02[8) 과 수량 데 이 터 (448004[8476 0813) 로 구 
분 하여 접 근 하 는 연 구 가 소 개 되 고 있다. 

수량 데 이 터 의 연 관 규칙 탐사 방 법 으로 수 량 항 목 
을 이 진 항 목 으로 변 환 하여 기 존 의 탐사 알 고 리 즘 으 
로 연 관 규칙 탐 사 를 고려할 수 있다. 이러한 방 법 에 
대한 기 존 의 연 구 [89] 가 있었다. 

8161801[8] 는 수 량 항 목 의 정 의 영 역 , 즉 도 메 인 올 
일정한 범 위 의 소 구 간 으로 일 괄 분 할 (0371000) 한 후, 
이 웃 한 (30080601) 소 구 간 분 할 을 병 합 (2 ㅁ 26780) 하 여 최 
소 지 지 도 를 만 족 하 는 빈발 구간 항 목 집 합 을 생 성 한다. 

이 경 우 에는 수량 항 목 의 정의 영 역 에 데 이 터 가 
골고루 분 포 된 경 우 에는 효 과 적 이지만, 일부 영 역 에 
집중된 경 우 는 비 효 율 적 인 면 이 있으므로 이의 해결 
방 법 으로 분 포 도 에 따라 분 할 하 는 유동적 분 할 법 [9] 
이 발 표 되 었다. 


이들 두 가지 방 법 은 2 단 계 의 절 차 를 거쳐 최 소 지 
지 도 를 만 족 하는 빈 발 구간 항 목 집 합 을 생 성 한다. 첫 
째 단 계 에 서는 소 간격 분 할 을 생 성 하며, 두 번째 단 
계 에서는 최 소 지 지 도 를 만족할 때 까지 이웃 소 구 간 
을 합 병 한다. 분 할 과 병 합 에 사 용 되 는 기 준 은 일 정 범 
위 분 할 법 에서는 최 소 지 지 도 만 사 용 하고, 유동적 분 
할 법 은 최 소 지 지 도 와 최 소 분 할 지 지 도 를 사 용 하여 
분할 및 병 합 을 실 시 하 였다. 

따라서 일 정 범위 분 할 법 은 데 이 터 의 분 포 를 고려 
하지 못하는 점이 약 점 이고, 유 동 분 할 법 은 최 소 분 할 
지 지 도 라 는 또 다른 분 할 기 준 을 사 용 함 으로써 분할 
을 위한 부 수 적 인 비 교 가 필요할 뿐만 아 니 라 사 용자 
가 임의로 최 소 분 할 지 지 도 을 설 정 해 야 하므로 최적 
의 기 준 설 정 이 어렵다는 문 제 점 이 있다. 


3. 빈 발 구간 항 목 집 합 생 성 방법 


3.1 데 이 터 발 생 의 지 역 성 


수량 항 목 은 그림 4 와 같이 다양한 유 형 으로 나타 
나고 있으며, 이들 항 목 들의 정의 영 역 (도메인) 또한 
좁은 영역, 넓은 영역 등 다 양 하다. 


(3) 변 환 이 필요한 수량 항목 
- 나 이 12200 세 
- 통 근 통학 소 요 시간 : 시 [분 
- 주 택 의 연 건 평 : ㅣ] ] 평 (0) 등 


(6) 조사표 상 에 분 할 하여 조사한 수량 항목 
- 컴퓨터 활용 상태 
0 매일 사 용 @) 1 주 일 1 회 사용 @@) 1 달 에 1 회 사용 
@) 1 달 에 1 회 미만 사 용 @ 사 용 하지 않음 
- 현 적장 근 무 연수 
00 6 개 월 미만 (2 6-12 개 월 미만 (63) 1-3 년 미만 
@ 3-5 년 미만 9 5-10 년 미만 @) 10-15 년 미만 
6) 15-20 년 미 만 @) 20 년 이 상 등 


그림 4. 센서스 항 목 중 수량 항 목 의 예 


그림 4 의 (6) 와 같이 정의 영 역 의 범 위 가 좁은 경우 
는 1 :1 매 핑 으로 연 관 규 칙 을 탐 사 할 수 있지만, (3) 
와 같은 경 우 는 정의 영 역 이 넓기 때 문 에 적정 간 격 의 
빈발 구 간 항 목 으 로 의 변 환 이 필 요 하다. 이때 해 당 구 
간의 빈 도 (66046005) 를 근 거 로 빈발 유 무 를 판 단 한 다. 
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그럼 5 의 (3) 는 인 구 주 택 총 조 사 의 대 전 지역 나이 
별 인 구 분포, (6) 주 택 의 연 건 평 별 가 구 분 포 , (0) 사업 
체 기 초 통 계 조 사의 종 사 자 규 모 별 사 업 체 분 포 를 나타 
낸다. 이 예 를 보면 정 의 영 역 내의 특정 영 역 을 중심 
으로 데이터 발 생 의 빈 도 가 집 중 되고 있 음 을 알 수 
있다. 이와 같은 특 성 은 예의 데이터 외에도 관심 지 
역 , 연령 등에 따라 음 반 판매, 영화관 관람자 등과 
같은 실 세 계 데 이 터 에서도 나타날 수 있는 특 성 이다. 

이 특 성 을 데이터 발 생 의 지 역 성 ()0023115) 라 정의 
한다. 이의 존 재 는 빈 도 가 가장 높은 최 빈 수 (22006) 
의 단 위 구 간 2' 을 기 준 으로 좌 ~ 우 로 확 장 하여 고려대 
상 구 간 을 설 정 하 였을 때, 고 려 대 상 구 간 이 차지하는 
비 율 ( ㅅ ) 과 빈 도 가 차지하는 비 율 (2) 의 비 (78066), 즉 
2/ ㅅ 의 값 으로 판 단 하 며 , 지 역 성의 정 도 라 정 의 한 다. 

그림 5 의 데이터 예 에서 고 려 대 상 구 간 을 50% 로 
하였을 때, (3) 에 대한 지 역 성 정 도 는 1.4200.71/0.5), 
(06) 는 1.94(0.97/0.5), (0) 는 1.99(0.995/0.5) 이 다. 이는 
최 빈 수 의 단 위 구 간 을 중 심 으로 주변 50% 의 구 간 에 
포 함 된 빈 도 가 전체 빈 도 의 71%, 97%, 99.5% 에 해당 
ㆍ 됨 을 의 미 한 다. (6) 와 (0) 경 우 는 지 역 성 이 극히 높은 
경 우 로써 빈도 3%, 0.5% 가 구간 50% 에 달하는 영역 
올 차지하고 있다. 이러한 구 간 은 신 뢰 도 를 바 탕 으로 
하는 규 칙 의 생성 단 계 에서 낮은 신 뢰 도 로 인하여 
효 용 성 이 부족한 구 간 이다. 따라서 이들 구 간 에서 생 
성 된 빈 발 구간 항 목 은 활 용 효 과 가 거의 없다. 

이와 같은 데이터 발생 분 포 의 특 성 인 지 역 성 올 
수량 항 목 의 연 관 규칙 탐 사 에 필요한 빈 발 구간 항목 
집 합 의 생 성 에 활 용 하고자 한다. 


3.2 지 역 성 을 고려한 빈 발 구간 항목 생 성 방법 
본 논 문 에서 제 안 하 는 방 법 은 최 빈 수 (20 ㅠ 2006) 의 단 
위 구 간 을 중 심 으로 수량 항 목 의 정 의 영 역 을 이 진 항 
목 으로 변 환 하 여 빈 발 구간 항 목 집 합 을 생 성 하는 방 
법 이다. 
3.3.2 빈 발 구간 항 목 집합 생성 알고리즘 
데이터 발 생 의 밀 집 도가 높은 영 역 이 최 빈 수 의 단 
위 구 간 이 다. 우수한 결 과 를 얻는 방 법 으로 이 최 빈 수 
의 단 위 구 간 을 이용하는 방 법 이다. 
3.3.1 기 호 설명 
빈 발 구간 항 목 집 합 을 생 성 하 기 위하여 필요한 데 


2) 수 량 항목 정 의 영 역 의 기 본 단 위 를 단 위 구 간 으로 정 의 한 다. 
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(8) 나 이 별 인 구 분포 


00 


나이 


(0) 연 건 평 별 가구수 


가구수 


(0) 종 사 자 별 사 업 체 수 


사 업 체 수 


1 4 서 어 버 101 
종 사 자 수 


그림 5. 데이터 발 생 의 지 역 성 ( 예 ) 


이 터 베 이 스 02), 수량 항 목 (Ｌ0), 발 생 빈 도 00.0)) 등 
의 기 호 를 다 옴 과 같이 정 의 한 다. 


ㆍ 는 유 한 한 범 위 의 수량 항 목 이 포 함 된 트 랜 잭 
션 들의 집 합 으로 10, (Ｌ0) 를 포 함 한 다. 

ㆍ ㄴ 0 는 { 701, 002 …. , 0471. 107 이며, / 때 (1 흐 1 흐 
0) 는 단 위 구간 항 목 (60) 으 로 이 산 (41607666) 하 다. 

ㆍ 100) 는 (002, 002), …. , 10072, 《002)) 이 며 , 
1000 (1 흐 1 흐 7) 는 단 위 구 간 에 서 데이터 발 생 빈도 
이타. 

ㆍ 1[0× 70 는 최 빈 수 (2 ㅁ 2006) 의 단 위 구 간 이 다. 

ㆍ 은 빈 발 구간 항 목 집 합 (12786 10681 1660- 
8665) 이 며 , 2 개 의 원 소 들 {1/1, 02. … 166 } 로 구 성 되고, 
각 각 은 최 소 지 지 도 (8 ㅠ .) 를 만 족 한다. 

ㆍ 70.60 즈 1 즈 2) 는 해당 단 위 구 간 /0, 의 사용 가 


능 여 부 를 표 기 한 다. 


빈 발 구간 항 목 집합 생성 방 법 은 1 차 최 빈 수 의 단 
위 구 간 (/07) 울 선택한 후, 이를 기 준 으로 인 접 ( 좌 ~ 
우 ) 단 위 구 간 (/0-1.70111 을 최 소 지 지 도 를 만족할 때 까 
지 병 합 한 다. 이때 좌 ~ 우 항 목 의 값 ( 빈 도 또는 지지 
도) 중에서 최 소 지지도 보다 높 거나 같으면서 가장 


' 끈 접하는 값 을 취하여 최 소 지 지 도 룰 만족할 때 까 지 


병 합 한다. 만약 하 한 한계 또는 상 한 한 계 3: 로 인하여 
더 이상 진 행 을 할 수 없을 경 우 는 한 쪽 값 만을 취하 
여 병 , 합 올 진 행 한 다. 진 행 도중에 양 쪽 ( 좌 ~ 우 ) 모두 
한 계 에 도 달 하면 비 빈 발 이 므로 빈 발 하지 않은 구간 
으로 설 정 하고, 다음 최 빈 수 의 단 위 구 간 을 선 정 하여 
동 일 하 게 진 행 한다. 

인접 단 위 구 간 을 병 합 하 는 도중에 최 소 지 지 도 를 
만 족 하면 병 합 을 중 단 하고, 빈 발 구간 항 목 집 합 에 포 
함 시키고, 동시에 빈 발 구간 항 목 영 역 으로 설 정 한다. 
계 속 하여 잔여 단 위 구간 중에서 최 빈 수 의 단 위 구간 
을 선 택 하여 동일한 방 법 으로 빈 발 구간 항 목 을 생성 
하며, 더 이상 단 위 구 간 이 존 재 하 지 않을 때 중단 
한다. 


// 최 소 지 지 도 (5.600) 는 사 용 자 가 지정 
// 12 를 검 색 하여 1(/0) 를 생성 
= 0 
10【 (6=1 ; 10 주 0; <++) 00 1068 
- ~ 1076 = 체 2※((070)), (00 196860, 1 으 1 즈 0) 
. 1.206686 701 ) 
6124. (360 47 
봐 = 42 20// ^0 ㅁ 5\60 
0 _/0 = 0 
// 16 90410 이 745 66[\660 1268800 < 58600 
탄 60 00 10 ㅠ @ ㅇ @ 048101 ㅁ 06810176 166005665 
16 = 04660 106 이 흐 1 즈 20// 00 18786 
600 


그림 6. 제안 빈 발 항 목 생성 알고리즘 


그림 6, 7 은 이러한 절 차 를 코 드 로 표 기 한 것이다. 
그림 6 은 최 빈 수 의 단 위 구 간 을 선 정 하여 660-Ｌ 함 
수 에 그 값 을 전 달 한 다. 그림 7 에 서는 전 달 된 단 위 구 


3) 상 한 과 하한 한 계 는 하 한 (401) 및 상 한 (/00) 경계 또는 
이미 사용한 영 역 의 단 위 구간 경 계 이 다. 


간 을 기 준 으로 최 소 지 지 도 (6.07) 를 만족할 때 까지 
좌 ~ 우 의 단 위 구 간 을 병 합 하는 절 차 를 수 행 한다. 이 
때 상 한 과 하한 경 계 의 인접 여 부 에 따라 4 가 지 경우 
(0856) 를 고 려 하고 있다. 

최 빈 수 의 단 위 구 간 을 기 준 으로 생 성 된 빈 발 구간 
항 목 은 그림 8 에 서 보 듯 이 1 차 최 빈 수 를 기 준 한 항목 
의 구 간 영 역 이 차 최 빈 수 를 기 준 한 항 목 의 구 간 영 
역 보다 좁 거 나 같다. 즉 , 1 차 에서 차로 진 행 될 수록 
빈 발 구간 항 목 의 폭 이 넓 어 지는 특 징 이 있다. 

이는 초 기 에 생 성 된 빈 발 구간 항 목 이 나중에 생성 
된 빈 발 구간 항목 보다 데이터 자 체 가 가지고 있는 
특 성 의 손 실 이 적은 세밀한 빈 발 구간 항 목 임을 의미 
한다. 그러므로 생 성 되는 빈 발 구간 항 목 의 생 성 순서 
는 향후 규 칙 (71168) 을 생 성 할 때 좋은 정 보 로 활 용 될 
수 있다. 


”04066000 (160 
107 (1=1; 차 0× 70 그 52060, 077) 00 56810 
06866 1 : /04 6, 800 10_619 806 00 1398860 


타 (}(7610 타 (0014)) 측 (92007 _/0) 
나 60 때 /0 ㅋ 1370 + 키 11) +1(0014): 
1, 206786 ㅇ 1017, (041) ) 467, 10949 = 18 
이 56 파 ([(706,-) 흐 1(6140) 200 
(82607 10※× 70) 즈 [(76;-])) 
탄 60 때 0×70 = 123 _/04 + 1(01-1); 
1, 206086 00171) /04.167 = 108 
이 56 448× 700 ㅋ = 412 _/0 ㅜㅠ (00614); 
10, 1061786 /0140: 04449 ㅋ 188 
6000 
600 
6856 2 : /4.4-; 15 ㅁ 0【 188@860,./0_51 148800 
370 = 43×_/04 + 1(011) ) 
11, 20617@6@ /01-11/0_61 ㅋ 188 
6856 3 : /0 6; 15 188860,./(0 51 00 19880 
떠 3× 00 = 따 2× 70 + 1(00041) ) 
10, 106066@ 00140: 10440 ㅋ 108 
ㅇ 856 4 : /40_ 6 8000 14015 128860 
1660470// 1), 15 7006 18786 
6200 


브 61010 


그림 7. 단 위 구간 병 합 함수 


빈 발 구간 항 목 집 합 을 생 성 하 는 절 차 의 예 는 표 2 
와 같 으 며 , 10 세 부터 40 세 까 지 의 31 개 단 위 구 간에 대 
하여 데이터 1000 건 , 최 소 지 지도 10% 를 사 용 하 였다. 
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1 차 최 반 수 (0099 


\ 차 최 빈 수 06049 


리나 1917 491 6961 00111 0 
수량 항 목 의 정의 영 역 (도메인) 
그림 8. 최 빈 수 를 이용하는 방법 


01 


그리고 이 데이터 고 려 대 상 구 간 을 50% 로 한 지 역 성 
의 정 도 는 1.12(0.56/0.5) 이 다. 

예의 결 과 는 빈 발 구간 항 목 은 8 개 , 비 빈 발 항 목 은 
3 개 가 생 성 되었다. 예 에서 1 차 , 2 차 로 생 성 된 빈발 
항 목 은 2 개 , 7 차 는 5 개 , 8 차 는 4 개 의 단 위 구 간이 병합 
되었다. 그러나 지 역 성의 정 도 가 높지 않아 병 합 된 
단 위 구 간 의 수 는 2 개 에서 5 개 로 편 차 가 그리 크지 
않다. 


4. 성 능 평 가 


본 논 문 에서 제안한 데이터 발 생 의 지 역 성 을 고려 
하여 빈 발 구간 항 목 집 합 을 생 성 하는 방 법 의 성 능 평 
가 위하여 3 가 지 방법, 즉 일 정 범위 분할 및 병 합 방법 
0401), 유동적 분할 및 병 합 방 법 (442) 그리고 제안한 
방 법 (843) 을 사 용 하여 생 성 되 는 빈 발 구간 항목 수 와 
함께 생 성 구 간 의 평 균 간 격 을 비 교 한다. 


성 능 평 가 에는 다 음 의 3 가 지 데 이 터 를 사 용 한 다. 

1) 인 구 주 택 총 조사 중 대 전 광 역 시 의 연령별 인구 
데이터 1.214,327 레코드 

1) 사 업 체 기 초 통 계 조사 중 대 전 광 역 시 의 종사자 
규 모 별 사업체 데이터 88,869 레코드 

11) 지 역 성 이 없는 모의 데이터 37,000 레코드 


이들 데 이 터 의 분 포 는 그림 5 의 (3), (0) 와 같 으 며 , 
그림 9 는 시 험 데 이터 11) 의 분 포 도 로써 지 역 성 이 전 
혀 없는 데 이 터 이다. 

또한 사용한 최 소 지 지 도 는 9 가 지 (4096, 3596, 30%, 
2596, 2096, 15%, 1096, 596, 396) 를 사 용 하였으며, 111 
에서 사용한 일 정 분할 간 격 은 23 802 의 최 소 분 할 지 지 
도는 최 소 지 지 도 의 1,.2 로 하였다. 


472 멀 티 미 디 어 학회 논문지 제 4 권 제 6 추 <2001. 10) 


표 2. 빈 발 구간 항목 생 성 과 정 ( 예 ) 


지 지 수 | 단 위 구간 | 최 빈 수 병 합 구 간 | 
(빈도) | 지 지 도 (%60)| 차수 | 지지도 


14 | 30 | 30 ㅣ | 
[161 | 38 | | 
| 7 | 38 | 38 | 5 차 | 


5 차 


지 지 도 ( 빈 도) 


11 | 01 
11 | | 
대 


단 위 구간 0 
그림 9. 데이터 11) 의 분포도 


4.1 생성 빈 발 구간 항 목 수 비교 


각 방 법 의 성 능 평가 결 과 는 그럼 10 과 같다. 이들 


표 률 보면 최 소 지지도 25% 이 상에서는 기존 방법 
0041, 842) 과 제안한 방 법 (543) 이 동일한 수 의 빈 발 구 
간 항 목 을 생 성 하지만, 25% 미 만 부터는 제안한 방법 
이 보다 많은 수 의 빈 발 구간 항 목 을 생 성 하 고 있 음 을 
알 수 있다. 


(8) 데이터 ｌ) 의 결과 


최 소 지 지 도 (*) 


{0) 데이터 !0) 의 결과 


10 


최 소 지 지 도 (%) 


그림 10. 생성 빈 발 구간 항 목 수 


각 데 이 터 별 시 험 결 과 를 살펴보면, 첫째 그럼 10 
(3) 의 경 우 는 최 소 지지도 25% 에 서 기 존 의 방 법 과 제 
안한 방 법 이 대 등 하 나 최 소 지 지 도 가 낮 아 질 수록 제 
안한 방 법 이 보다 많은 빈 발 구간 항 목 을 생 성 함 을 
알 수 있다. 


둘 째 로 높은 지 역 성 을 갖는 데 이 터 의 결 과 인 (6) 
는 기 존 의 방 법 인 \41 과 02 가 동일한 반면, \13 는 
최 소 지지도 15% 부 터 빈 발 구간 항 목 수가 중 가 하고 
있다. 

마 지 막 으로 지 역 성 이 전혀 없는 데 이 터 에 대한 결 
과 인 (0) 는 최 소 지지도 409%, 35% 에 서는 542 가 우수 
하고, 20% 와 15% 에 서는 */2 와 503 가 비 슷 하 다. 반면 
에 10% 이 하에서는 843 가 보다 많은 빈 발 구간 항목 
을 생 성 하 고 있다. 

이 상 과 같이 제안한 방 법 이 기 존 의 방 법 보다 최소 
지지도 25% 이 상에서는 동등한 성 능 이지만, 최 소 지 
지도 25% 미 만 에서는 보다 많은 빈 발 구간 항 목 을 
생 성 할 수 있으므로 성 능 의 우 수 함 을 보여준다. 


4.2 구간 평 균 간격 비교 


각 방 법 으로 생 성 된 빈 발 구간 항 목 들의 구 간 들의 
평 균 간 격 은 그림 11 과 같다. 이들 그 래 프 를 보면 대 
체로 데 이 터 의 분포 특 성 에 따라 841 방 법 과 5442, 513 
가 큰 차 이 가 있 음 을 알 수 있다. 이는 테 이 터 의 분포 
를 고 려 하지 않은 841 방 법 이 다소 큰 간 격 의 빈 발 구 
간 항 목 들을 생 성 하고 있다. 

각 데 이 터 별 구간 평 균 간 격 을 살펴보면, 첫째 그 
림 11 의 (9) 는 최 소 지지도 25% 미 만 에서는 큰 차이 
가 없으나, 25% 이 상 에서는 데이터 분 포 의 특 성 을 
고 려 하지 않은 801 의 구간 평 균 간 격 이 타 방 법 에 비 
하여 월등히 넓 음 을 알 수 있다. 그리고 데이터 분포 
의 특 성 을 고려한 방 법 인 *42 와 803 는 최 소 지 지 도 에 
따라 차 이 는 있지만 대체로 843 가 좁은 구간 평 균 간 
격의 빈 발 구 간 항 목 집 합 을 생 성 함 을 알 수 있다. 

둘째, 표 11 의 (6) 는 높은 지 역 성의 데 이 터 에 대한 
빈 발 구간 항 목 들 의 구간 평 균 간격 비교 그 래 프 이다. 
데 이 터 의 분 포 특 성 으로 인하여 411, 843 의 평 균 구간 
간 격 이 특 이 하게 나타나고 있다. \1 은 최 소 지지도 
30% 에 서 15% 사 이에 넓은 구간 평 균 간 격 이 보이고 
있다. 이는 데이터 분 포 의 특 성 올 고 려 하지 않았기 
때 문 이 다. 43 의 경우 ' 특 9/ 부 분 이라 표 시 한 부 분 에 
유달리 넓은 구간 평 균 간 격 을 보이고 있다. 이는 앞 
(3.1 절 ) 에 서 언 급 한 바와 같이 빈 도 가 극히 낮은 영역 
에서 생 성 된 빈 발 구간 항 목 으로 인하여 구간 평 균 간 
격 이 넓게 나타나고 있다. 이러한 경 우 는 생 성 순서 
정 보 를 활 용 하여 제 거 하거나 규 칙 생성 과 정 에서 활 
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용 유 무 판 단 이 필 요 하 다. 

\43' 은 543 가 생 성 한 빈 발 구간 항 목 들 중 애서 나중 
에 생 성 된 것을 제 외 하여 842 와 동일한 수 의 빈 발 구 
간 - 항 목 에 대한 구간 평 균 간 격 이다. 그 결과 543' 는 
02 와 거의 동일한 구간 평 균 간 격 을 보이고 있다. 


(8) 데이터 [의 결과 


--481 
30 ~ 2 
25 -&- 보 3 


구간 평 균 간격 


40 35 30 25 20 15 10 5 3 
최 소 지 지 도 (*) 


(0) 데이터 의 결과 


평 균 간격 


구간 
ㄱ 


최 소 지 지 도 (*) 


(6) 데이터 11/ 의 결과 


구간 평 균 간격 


최 소 지 지 도 (*} 


그림 11. 구간 평 균 간격 


마 지 막 으로 그림 11 의 (0) 는 지 역 성 이 없는 모의 
데 이 터 에 대한 구간 평 균 간 격 의 그 래 프 이다. 이 대이 
터 에 대해서는 세 가지 방법 모 두 의 구간 평 균 간 격 이 
유 사 하게 나타나고 있다. 즉 최 소 지 지 도 에 따라 구간 
평 균 간 격 이 넓 어 지 기도 하고 좁 아 지기도 한다. 이러 
한 데이터 분 포 는 많은 빈 발 구간 항 목 을 생 성 하는 
방 법 이 우수한 방 법 이다. 


4.3. 성 능 평가 종합 
이 상 과 같이 각 방 법 에 대하여 생 성 되 는 빈 발 구간 
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항 목 수 와 생 성 된 빈 발 구간 항 목 들의 구간 평 균 간 격 
을 비 교 하여 보았다. 

이들을 종 합 하여 보면, 생 성 되는 빈 발 구간 항 목 수 
는 최 소 지 지도 25% 를 기 준 으로 그 이 상 에서는 세 
가지 방 법 이 대 등 하지만, 구간 평 균 간 격 은 501 의 월 
등 히 넓게 나타나고 있고, 다 음 에 412, 843 순 으로 
나타나고 있어 제안한 방 법 이 우 수 함 을 알 수 있다. 

반 면 에 최 소 지 지도 25% 미 만 에서는 제안한 방법 
이 많은 수 의 빈 발 구간 항 목 을 생 성 하 고 있지만, 데 
이 터 의 분포 특 성 으로 인하여 구 간 평 균 간 격 이 넓어 
지는 경 우 가 발 생 하였다. 이는 많은 수 의 빈 발 구간 
. 항 목 올 생 성 하 여 도 모든 항 목 이 세 밀 하 지 않을 수 
있 음 을 의 미 한다. 그 러 나 제안한 방 법 은 생 성 되는 순 
서 정 보 도 동시에 생 성 하기 때문에 이를 이 용 하 여 
효 용 성 이 떨어지는 구 간 을 제 고 할 수 있다. 즉 초기 
에 생 성 된 빈 발 구간 항 목 은 세밀한 항 목 이며, 그 이 
후 생성 순 서 에 따라 항 목 의 세 밀 도가 조금씩 떨어지 
는데, 사 용 자 는 이들 순 서 정 보를 적절히 활 용 함으로 
써 보다 우수한 연 관 규 칙 을 발 견 할 수 있기 때 문 이 다 . 


5. 결론 및 향 후 과제 


본 논 문 에서는 수량 항 목 을 포 함 하는 대 용 량 의 데 
이 터 베 이 스 에서 연 관 규 칙 의 탐 사 를 위해 수량 항목 
의 정 의 영 역 을 이 진 항목 형 태 의 빈 발 구간 항 목 으로 
변 환 하는 보다 효율적인 방 법 울 제 안 하였다. 그리고 
인 구 주 택 총 조사 등 실제 데 이 터 룰 사 용 하여 성 능 평 
가를 실 시 하여 제안한 방 법 이 기 존 의 방 법 보다 보다 
많은 수 의 세밀한 빈 발 구간 항 목 집 합 을 생 성 할 수 
있으므로 성 농 의 우 수 함 을 알았다. 

제안한 방 법 은 탐사 대상 데 이 터 가 가지는 특성, 
즉 데이터 발 생 의 지 역 성 을 고 려 하는 방 법 으로 최 빈 
수 를 빈 발 구간 항 목 생 성 을 위하여 사 용 하였다. 최 빈 
수 를 사 용 함 으로써 얻는 효 과 로는 보다 세밀한 반발 
구간 항 목 을 생 성 함 은 물론 그 림 8 애 서 와 같이 최 빈 
수 의 차수, 즉 생 성 순 서 에 따라 빈 발 구간 항 목 의 세 
밀 도 가 감 소 하는 특 징 이 있다. 이는 생 성 되는 빈 발 구 
간 항 목 의 순 서 에 따라 원 데 이 터 가 가지고 있는 특 
성의 손실 정 도 가 다르다는 것이다. 즉 초 기 에 생성 
된 것이 나중에 생 성 된 것 보다 손 실 이 적은 특 징 을 
가진다. 이 특 징 은 향후 연 관 규 칙 을 탐 사 할 때, 필요 
한 규 칙 의 질 (448145) 의 정 도 에 따라 사 용 자 가 빈발 


구간 항 목 의 생 성 순 서 를 감 안 하여 활 용 유 무 를 조정 
할 수 있다. 다만, 이 때 고 려 하여야 할 사 항 은 최 빈 수 
가 지 역 성 이 없는 영 역 에 존 재 하 는 톡 이한 분 포 의 
데 이 터 일 경 우 는 초 기 에 생 성 된 빈 발 구간 항 목 이 앞 
서 언 급 한의 톡 징 을 갖지 못할 수 있다는 것을 감안 
하여야 한다. 

향 후 의 연구 과 제 로 는 첫째, 앞에서 언 급 한 바와 
같이 빈 발 구간 항 목 의 생 성 순 서 룰 연 관 규 칙 의 탐사 
에 효과적으로 활 용 하는 방 법 에 대한 연 구 이 다. 둘째 
과 제 는 3.1 절 의 예 에서 본 바와 같이 조사 당시에 분 
할 된 수 량 항 목 의 경 우 에 대한 빈 발 구간 항 목 집 합 의 
생 성 방 법 에 대한 연 구 도 필 요 하다, 


참 고 문 헌 


[ 1 ] 않 끼 027 5. \6166, 피 100 100420052, 277600 ㅇ 00706 
72000 24417279, 34107820 &0010010070 [41211611675, 
106., 580 078001800, (91107012, 1998. 

[2] 표 46580\81, 프 . 19016400910, 300 스 . 5\2201, 
“10108 86960010000 14168 16[\660 5066 0 
16609 10 18786 02621[025668 , 22 2700 2 2260 4 (222 
57 (72002(222 (207/0607107206 077 2400209607770707/ 22000, 
1200. 207-216, 1993. 

[3] 표 . 2012\21 400 브 . 52620, "8068 2.160 ㅁ 0706 
107 7010108@ 8560013000 14168 , 277/2 2270000010705 
4 2026 2002 177.222 (0020067070700, 5800880, (01116, 
으 606., 1994 

[4] ].96. 00 차... 아 60 200 28. 04, "0 06006 
11166-[ ㅁ 8560 21601107120 10": 7 ㅁ 211010@ 856001200270 ㅁ 
74168 , /77270066001965 0 4( 가 2 51 (2274(222 (2007- 
7607002060 077 4240020607770077 0 47002, 00. 175-186, 
107 1995. 

[5] 스 . 52725616, 튜 . (070160010867 200 을. 찌 278006, 
“20 610016021802 ㅁ 001 107 7010108 74165 12 
13186 02[0103665 , 271 2700000807795 0 106 27 
하 2.2723 (207070700200, 20. 432-444, 1995. 

161] ].5. 206, 모 .5. 보 14 200 1. 5. 아 60, "410108 
스 5600180004 트 4165 \101 ^0105681016 스 0007805 ^, 
2172 .7700660071065 0 4(244 (44002 97, 00. 151-160, 
피 0760006 1997. 

[7] 타 .]. 2394, 5. 2007012589720157, \@1 1, 300 
06112, 87231048000 아 580021108 10 10268 40- 


3990 


108 이 스 590012007 브 4168 ^, 1116 04701. 브 0016566「 
그 601001021 16004 017, 147 1996. 

[8] 뷰 . 90690 300 브 . ^612\ 힌 , "01008 (20482- 
18076 스 560018000 84168 10 1 ㄴ 86496 02000! 
1210169 , 270000007995 0 000 4(44 57(772(0027 
(2070070000 071 240070900072007 0 74204. 1406 1996. 

[9] 최영희, 장 수 민 , 유 재 수, 오 재 철 , “ 수 량 적 연 관 규 
칙 탐 사 를 위한 효율적인 고 빈 도 항 목 열 생성기 
법 ”, 한 국 정 보 처 리 학회 논문지 제 6 권 제 10 호 , 
200. 2597-2607, 1999. 

[0 10] 표 2978\21, 브 . 12028, 브 . 3 ㅁ 2006 브 . 그 '61- 
70060, 900 스 . 41660 60627200, 381 101900 ㅋ 6 
이 2960018000 브 4166 , 2777 400002069 271 7(720007- 
00096 .12025900007 0070 1200 /7)47720070, 2 ㅅ 1 17685, 
200. 307-328, 1996 

111] 을. 2220, 보 . 400[\0201, ].2. 041109480 2200 5, 1900, 
“120\0849010 1661456 (60040008 800 170211080 ㅁ 070 
브 미 65 107 48066 20916 2802", 272 2770066007725 
8424 592(22(2/2 (42060707200 0022 242072026 07770 
와 72200, 00. 256-264, 137 1997. 


데 이 터 의 지 역 성 을 이용한 빈 발 구간 항 목 집 합 생 성 방법 475 


박 원 환 
1982 년 충 남 대 학교 전 산 학 과 (이학 
사 ) 
1986 년 충 남 대 학교 대학원 전산학 
과 ( 이 학 석사) 
1996 년 전 자 계 산 조 직 응용 기술사 
19078~ 현재 순 천 향 대 학교 대학 
원 박 사 과정 
1988 년 ~ 현 재 통계청 전 산 서기관 
관 심 분야 : 병 렬 처리, 데 이 터 마이닝, 데이터베이스 


박 두 순 
1981 년 고 려 대 학 교 수 학 과 ( 이 학 사 ) 
1983 년 6 대학원 전산학 
과 ( 이 학 석사) 
1996 년 고 려 대 학교 전산학 전 공 (이 
학 박사) 
1992 년 -1993 년 미국 0. 아 14110015 
하 0008108-( 네 00818 (0 


객 원 교수 


2000 년 ~ 현 재 순 천 향 대 학교 컴 퓨 터 교육원 원장 
1985 년 ~ 현 재 순 천 향 대 학교 정 보 기 술 공학부 교수 
관 심 분야 : 병 렬 처리, 데 이 터 마이닝, 정 보 검색, 멀티미디어 


